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摘要 : 中 国 植物 物种 信息 数据 库 是 中 国 科学 院 科 学 数据 库 参 考 型 数据 库 ， 中 国 植物 名 称 数据 库 (CPNI) 
是 中 国 植物 物种 信息 数据 库 最 重要 的 组 成 部 分 ， 是 中 国 植物 物种 信息 数据 库 收录 植物 的 目录 和 索引 ,也 是 
其 他 数据 库 的 参考 和 联系 的 桥梁 。 以 《中 国 植物 志 》 和 《Flora of China》 为 基础 数据 来 源 ， 加 上 少量 参考 
数据 作为 补充 设计 建设 了 中 国 植物 名 称 数据 库 ， 并 从 现 有 已 建成 同类 数据 库 的 评价 、 数 据 来 源 和 数据 组 
成 ， 以 及 建 库 策略 实现 对 中 国 植物 名 称 数据 库 建 设 进行 了 分 析 和 探讨 。 中 国 植物 名 称 数据 库 是 植物 名 称 的 
参考 型 数据 库 ， 能 够 辅助 植物 学 相关 学 科研 究 中 关于 植物 名 称 的 研究 和 利用 。 
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The Researching and Discussion on the Construction of the 
Database of Chinese Plant Names Index (CCPNJ) 


ZHANG Yu”’*, WANG Yu-Hua'”™ 


(1 Key Laboratory of Economic Plants and Biotechnology, Kunming Institute of Botany, Chinese Academy of Sciences, 


Kunming 650204, China; 2 Graduate University of Chinese Academy of Sciences, Beijing 100049, China) 


Abstract: The Chinese Plants reference database (CPRD) is a part of the Scientific Database. The Chinese 
Plant Names Index (CPNJ) is one of the important parts of CPRD, because it is the names index of CPRD 
and the bridge to other plant databases. Based on the Chinese version and English version of “Flora of Chi- 
na”, the CPNI was constructed with other little reference data. Then, the advantages and disadvantages of 
the databases of plant names which have been published in the world, the data resources and the construction 
strategies of the Chinese plant names was discussed. The CPNI is a reference database of the Chinese Plant 
Names which can be used on studies on plant sciences especially when the names of the plants which are stud- 
ied on must be ensured. 
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我 国 是 世界 上 10 个 生物 多 样 性 大 国之 一 ， 事物 的 直接 标识 。 而 植物 的 “名 称 标识 ”就 是 植 












































生物 物种 极为 丰富 ， 中 国 拥有 高 等 植物 3 万 余 物 的 唯一 合法 学 名 ， 且 每 一 个 分 类 等 级 都 具有 唯 
种 ， 其 中 至 葡 、 厂 类 、 裸 子 植物 和 被 子 植物 分 别 ”一 的 合法 学 名 〈 张 丽 兵 译 ，2007)。 对 于 植物 学 
占 世 界 总 数 的 9.1%、22%、26.7% 和 10% ( 裴 ”研究 者 来 说 ,确定 研究 对 象 的 唯一 合法 学 名 是 整 
个 研究 的 首要 前 提 。 中 国 植物 名 称 数据 库 (the 














关 关 














省 科技 计划 项 目 (2009CC016) 

通讯 作者 : Author for correspondence; E-mail: wangyuhua@ mail. kib. ac. cn 

必 稿 日 期 ， 2010-05-10 ，2010-07-20 接受 发 表 

作者 简介 : 张 宇 1985 一) 男 ， 在 读 硕 士 研究 生 ， 主 要 从 事 植物 学 ， 植 物资 源 与 生物 多 样 性 信息 方向 研究 工作 。 


























基金 项 目 : 中 科 院 科学 数据 库 项 目 (INFO-115-C01-SDB1-02); 科技 部 科技 基础 性 工作 专项 重点 项 目 (2007FY110100); 云南 


402 云南 植物 研究 第 32 卷 








Chinese Plant Names Index, CPNI) 是 依照 中 国 
科学 院 科学 数据 库 中 参考 型 数据 库 建设 标准 规范 
(中 国 科 学 院 计算 机 网 络 信息 中 心 科 学 数据 中 心 ， 
2009)， 以 中 国 科 学 院 昆 明 植 物 研究 所 为 主 的 相 
关 研 究 机 构 长 期 积累 的 数据 为 基础 建成 的 符合 国 
家 或 国际 标准 、 有 严格 质量 控制 与 管理 、 内 容 具 
有 完整 性 和 权威 性 的 数据 库 。 它 是 《中 国 植物 物 
种 信息 数据 库 》 的 一 部 分 ， 也 是 整个 物种 信息 数 
据 库 的 物种 名 录 和 查询 索引 ; 是 连接 物种 信息 库 
中 各 个 子 数据 库 的 桥梁 ， 也 是 物种 数据 库 和 其 他 
数据 库 之 间 联 系 的 纽带 。 所 以 成 功 建成 中 国 植物 
名 称 数据 库 是 整个 中 国 植物 物种 信息 数据 库 建设 
成 功 的 关键 所 在 ， 在 建设 过 程 中 产生 的 相关 问题 
和 结论 亦 值得 深入 研究 探讨 。 






































1 国内 外 同类 数据 库 的 建设 情况 及 其 评价 

自 1992 年 环境 与 发 展 大 会 召开 以 来 ， 各国 
政府 和 从 事 生 物 多 样 性 保护 的 国际 组 织 普遍 提高 
了 对 生物 多 样 性 信息 收集 和 管理 的 重视 程度 ， 开 
发 建立 了 大 量 的 联网 数据 库 和 网 站 。 比 较 知 名 的 
有 species2000， 国 际 植 物 名 录 (The Interna- 
tional Plant Names Index, IPNI)、 the Integrat- 























ed Taxonomic Information System (ITIS)、 In- 
ternational Organization for Plant Information 
(IOPI) 、TROPICOS8 等 等 (Singh，2004)。 这 
些 基 于 生物 多 样 性 的 植物 数据 库 的 出 现 ， 极 大 地 
促进 了 相关 研究 和 公众 关注 程度 。 国 内 主要 开发 
了 中 国生 物 多 样 性 信息 系统 CCBIS)、 中 国 物种 
言 息 系 统 (CSIS)、 中 国 科 学 数据 库 (CSDB)、 
中 国 科 学 院 院 生物 局 “生物 物种 与 标本 信息 系 
统 ” 和 国家 科技 基础 平台 生物 标本 馆 项 目 ， 以 及 
不 少 的 地 方 或 专业 的 中 小 型 库 。 中 国生 物 多 样 性 
数据 资源 的 建设 通过 以 上 项 目的 大 力 支 持 得 到 了 
长 足 发 展 。 
1.1 国外 同类 著名 数据 库 的 建设 情况 与 评价 
国外 尤其 是 欧美 国家 在 植物 数据 库 建设 方面 
起 步 较 早 ， 现 已 建成 多 个 著名 的 大 型 植物 数据 
库 。 就 提供 名 称 信息 查询 而 言 ， 最 著名 的 当 数 
species 2000， 现 在 该 数据 库 已 经 建立 中 国 节点 
并 收录 “中 国 植物 名 录 ”(China Plant Cata- 
logue，CNPC)， 提 供 植物 基本 名 称 信息 查询 ， 
包括 接受 发 表 学 名 、 异 名 、 官 方 名 (CNPC 还 提 




































































供 中 文官 方 名 )、 分 类 信息 、 作 者 引证 及 作者 信 
息 、 数 据 来 源 和 文献 信息 、 在 线 相关 链接 等 信 
息 , 但 species 2000 毕竟 是 基于 生物 多 样 性 保护 
而 建设 的 ， 提 供 名 称 信 息 并 不 是 其 主要 任务 ， 所 
以 species 2000 也 只 能 是 提供 植物 名 称 基 本 信息 
的 一 个 “植物 名 录 ” 而 已 ， 不 能 进一步 提供 植物 
命名 上 更 为 深入 细致 的 信息 。 相 比较 species 
2000 而 言 ， 国际 植物 名 录 (The International 
Plant Names Index, IPNI) 是 专业 的 植物 名 称 
数据 库 。IPNI 以 APNI，GCI 以 及 KI 三 大 国际 
权威 性 数据 源 作为 其 后 台数 据 库 ， 使 得 其 具有 了 
得 天 独 厚 的 先天 优势 ， 也 被 写 人 了 《国际 植物 命 
名 法 规 》 作 为 推荐 参考 的 国际 标准 植物 名 称 查 询 
系统 。IPNI 的 优势 不 仅 体 现在 其 权威 性 ， 还 在 
于 其 专业 性 和 全 面 性 ， 除 了 能 够 提供 大 多 数 植物 
名 称 基 础 信息 外 ， 还 提供 了 详细 的 作者 信息 、 文 
献 引 证 信息 ， 并 且 能 够 通过 多 种 方式 查询 植物 名 
称 信息 。 然 而 IPNI 过 于 专业 化 ， 虽 然 在 学 名 信 
息 查 询 上 优势 明显 ， 却 不 能 够 提供 更 多 的 其 他 名 
称 信息 ， 比 如 通用 名 ， 官 方 名 等 等 。 其 它 提供 植 
物 名 称 信 息 查 询 的 还 有 the Integrated Taxonom- 
ic Information System (ITIS)， 密 苏 里 植 物 园 的 
TROPICOS 等 ， 他 们 提供 的 查询 内 容 都 大 同 小 
异 。 不 过 ， 国 外 数据 库 的 最 大 优势 ， 并 不 是 权威 
性 和 海量 数据 ， 而 是 各 个 大 型 数据 库 之 间 拥 有 
套 完善 的 交流 分 享 机 制 ， 可 以 互相 查询 ， 互 相 整 
合 ， 形 成 一 个 植物 科学 的 强大 网 络 知识 体系 。 
1.2 国内 同类 数据 库 的 建设 情况 与 评价 

国内 早 在 上 直 纪 90 年 代 就 已 经 开始 了 植物 
数据 库 的 规划 建设 ， 至 今 已 经 有 中 国生 物 多 样 性 
信息 系统 (CBIS)、 中 国 物种 信息 系统 (CSIS)、 
中 国 科 学 数据 库 (CSDB)、 中 国 科 学 院 生物 局 
“生物 物种 与 标本 信息 系统 ”、 中 国 科 学 院 昆 明 植 
物 研究 所 的 《中 国 植物 志 》 数 据 库 、《 中 国 种 子 
植物 》 数 据 库 和 《云南 高 等 植物 电子 词典 》 等 大 
中 型 数据 库 ， 另 外 也 出 现 了 众多 专业 和 地 方 性 的 
中 小 型 数据 库 ， 如 景观 植物 信息 查询 系统 
(LPIIS) 〈 韩 成 峰 和 张志国 ,2004)， 以 及 《湖北 
省 植物 志 》 数 据 库 ( 董 梅 等 , 2005) 等 。 这 些 数 
据 库 的 建设 与 应 用 对 我 国 植物 科学 ， 尤 其 是 植物 
生物 多 样 性 的 研究 和 保护 起 到 了 重要 的 推动 作 
用 。 不过， 相对 而 言 ， 专 门 提供 植物 名 称 信 息 查 
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询 的 数据 库 在 我 国 十 分 罕见 ， 较 为 成 熟 的 仅见 中 
国 科 学 院 植 物 研 究 所 的 “中 国 植 物 名 录 
(CNPC)”， 而 且 还 是 species 2000 国际 合作 项 目 
的 子 项 目 。 其 他 数据 库 只 是 顺带 提供 接受 发 表 学 
名 和 中 文官 方 名 的 查询 ， 收 录 的 数据 太 少 以 至 于 
不 能 够 满足 用 户 需 求 ;部 分 数据 库 缺 乏 维护 ， 收 
录 的 数据 “年 代 久 远 ” 而 严重 过 时 ; 某 些 数据 库 
还 大 量 设 置 访问 权限 ， 需 要 相当 权限 或 者 高 额 费 
用 才能 访问 其 核心 数据 。 基 于 这 些 现状 ， 我国 急 
需要 一 个 自主 研发 的 ， 内 容 全 面 ， 信 息 权 威 ， 查 
询 科 学 ， 实 时 更 新 ， 自 由 共享 的 新 一 代 植 物 名 称 
参考 型 数据 库 。 






























































2 数据 基础 与 建设 内 容 
2.1 植物 的 名 称 数据 组 成 分 析 

根据 最 新 《国际 植物 命名 法 规 》 的 相关 规 
定 ， 植 物 的 名 称 包括 接受 发 表 学 名 、 异 名 、 保 留 
名 等 等 ， 而 其 中 异 名 又 分 为 分 类 学 异 名 、 命 名 学 
异 名 、 基 原 异 名 等 等 。 从 单个 的 学 名 来 说 ， 对 于 
种 这 一 分 类 等 级 ， 完 整 的 学 名 由 属 名 、 种 加 词 、 
命名 作者 、 来 源 文献 组 成 ， 对 于 种 以 上 的 分 类 等 
级 ， 则 由 名 称 、 命 名 人 和 来 源 文献 构成 ， 对 于 种 
下 等 级 ， 则 还 包括 相应 的 标识 、 如 变种 (var. )、 
亚 种 (subsp. ) 等 等 ， 以 及 相应 的 加 词 、 命 名 作 
者 和 文献 来 源 。 这 些 组 成 部 分 按照 一 定 的 规则 排 
列 得 到 一 个 完整 的 植物 名 称 。 一 条 完整 的 植物 名 
称 记录 可 以 看 作 一 条 按 一 定 规则 生成 的 编码 ， 亦 
可 转换 为 相应 的 条 形 码 ， 作 为 植物 名 称 的 唯一 识 























别 依据 。 
2.2 中 国 植物 名 称 数据 库 的 建设 内 容 、 数 据 组 
成 与 来 源 





中 国 植物 名 称 数据 库 的 目标 是 实现 “中 国 植 
物 电子 名 录 ” 和 “中 国 植 物 名 称 电 子 词 典 ” 以 及 
“中 国 植物 物种 信息 数据 库 查 询 索 引 ” 三 大 功能 。 
基础 数据 库 由 “一 库 两 名 录 ” 构 成 ， 即 : 一 个 名 
称 数据 库 和 两 个 彼此 联系 而 又 相互 独立 的 《中 国 
植物 名 录 》 分别 基 于 《中 国 植物 志 》 和 《Flora 
of China》) 。 所 包含 的 内 容 包括 植物 的 拉丁 名 称 
(接受 发 表 学 名 ， 异 名 )、 中 文 名 (官方 名 ,通用 
名 ， 地方 名 ,行业 名 等 )、 植 物 命名 信息 (接受 
发 表 学 名 详细 ， 作 者 引证 ， 文 献 引证 ， 植 物 志 索 
引 )， 分 类 信息 〈 科 属 ， 种 及 种 下 等 级 ) 四 大 块 。 



































另外 还 包含 了 一 些 为 了 实现 上 面 “三 大 功能 ”和 
智能 化 检索 所 加 入 的 其 他 预 处 理 信 息 以 及 开发 的 
小 工具 。 根 据 用 户 需 求 ， 还 加 入 了 分 布 信息 、 特 
有 标识 和 生活 型 等 少量 “ 非 名 称 信 息 ”。 

中 国 植物 名 称 数据 库 的 数据 分 为 基础 数据 和 
参考 数据 。 基 础 数据 是 中 国 植物 名 称 数据 库 的 主 
要 数据 和 核心 数据 ， 占 绝 大 部 分 。 作 为 参考 型 数 
据 库 ， 必 须 保证 数据 的 正确 与 规范 ， 所 以 除了 专 
门 制定 相关 数据 标准 规范 外 ， 基 础 数据 全 部 来 源 
于 权威 工具 书 《 中 国 植物 志 》 和 《Flora of Chi- 
na》。 由 于 志 书 本 身 记 载 不 完善 ， 有 少 部 分 没有 
记载 的 信息 就 要 从 其 他 资料 或 来 源 搜集 ， 这 部 分 
就 是 参考 数据 。 参 考 数据 来 源 于 其 他 经 考察 认为 
相对 可 靠 的 途径 ， 按 照 事先 制定 的 标准 规范 ， 经 
过 考证 后 加 入 ， 由 于 无 法 完全 确定 其 正确 性 ， 所 
以 仅 供 参考 。 
































3 建 库 策 略 实现 
3.1 找 准 定位 和 用 户 对 象 
3.1.1 专门 针对 特定 的 用 户 对 象 ”一 个 好 的 数 
据 库 服务 系统 ， 首 先是 一 个 受用 户 欢迎 和 好 评 的 
系统 。 所 以 要 建设 一 个 好 的 植物 名 称 数据 库 ， 首 
先 要 搞 清楚 面 对 的 是 什么 样 的 用 户 ， 了 解 用 户 需 
要 什么 。 正 如 species 2000 面向 的 是 与 生物 多 样 
性 研究 与 保护 相关 的 科学 家 ， 所 以 十 分 注重 物种 
收录 的 丰富 程度 和 地 区 性 ，USDA 面向 美国 的 
广大 农业 和 园艺 工作 者 和 爱好 者 ， 所 以 专注 于 收 
录 有 用 的 美国 资源 植物 ， 并 提供 详细 的 栽培 养 
护 ， 应 用 开发 等 信息 〈Singh，2004)。 中 国 植物 
名 称 数据 库 面向 的 是 植物 学 及 相关 学 科 的 科研 人 
员 ， 他 们 不 仅 需要 知道 接受 发 表 的 学 名 和 中 文通 
用 名 ,还 要 了 解 名 称 的 来 源 、 分 类 等 级 、 中 文 俗 
名 等 等 更 为 详尽 的 信息 。 所 以 中 国 植物 名 称 数据 
库 只 提供 接受 发 表 的 学 名 是 远 远 不 够 的 ， 还 要 提 
供 相关 的 文献 来 源 、 植 物 的 异 名 、 中 文通 用 名 、 
俗名 等 等 ， 全 方位 的 满足 植物 学 研究 人 员 所 需 。 
3.1.2 根据 用 户 需要 建设 ,尽量 全 面 提供 信息 
在 中 国 植物 名 称 数据 库 中 ， 按 照 惯例 提供 了 
常规 的 名 称 信息 查询 检索 ， 如 分 类 等 级 ( 科 属 )， 
接受 发 表 学 名 、 异 名 、 详 细 的 学 名 信息 ( 属 名 ， 
种 加 词 ， 作 者 信息 ， 种 下 等 级 及 作者 信息 )、 名 
称 来 源 文献 、 中 文 名 (通用 名 ， 俗名， 地 方 名 ， 
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行业 名 等 )。 在 国内 外 已 经 建成 的 植物 数据 库 中 ， 
提供 的 植物 名 称 信息 大 体 也 是 上 述 内 容 。 
然而 根据 对 用 户 的 走访 调查 和 用 户 反 馈 ， 发 
现 用 户 查 询 植 物 名 称 的 时 候 ， 不 仅仅 只 关心 植物 
的 名 称 信 息 ， 还 关心 植物 的 特有 性 、 分 布 、 生 活 
型 等 “ 非 名 称 信息 ”， 尽 管 中 国 植物 物种 信息 数 
据 库 有 专门 的 子 库 提 供 相关 信息 查询 ， 但 用 户 表 
示 “ 不 太 方便 ”， 根 据 用 户 这 一 需求 ， 加 入 了 一 
些 “ 额 外 ”信息 ,包括 中 国 特 有 标识 、 分 布 
(省 ,自治 区 ， 直 辖 市 级 )、 简 要 的 生活 型 ( 草 
本 ， 木 本 等 )， 以 方便 用 户 所 需 。 

根据 用 户 需求 和 实际 情况 以 及 标准 规范 化 的 
要 求 ， 还 提供 独立 的 可 供 下 载 查询 的 《中 国 植物 
名 录 》。 
3.2 数据 共享 策略 

中 国 植物 名 称 数 据 库 是 一 个 参考 型 数据 库 ， 
在 不 造成 版 权 纠纷 的 前 提 下 ， 原 则 上 面向 广大 用 
户 免费 、 自 由 地 提供 信息 ， 在 信息 检索 服务 上 ， 
除了 少数 可 能 涉及 版 权 问题 的 资源 ， 绝 大 部 分 资 
源 不 再 设置 访问 权限 。 

在 数据 库 中 添加 了 对 应 的 流行 通用 植物 编号 
代码 等 ， 如 中 国 植物 分 类 标准 代码 ， 仅 由 属 名 、 
种 加 词 构成 的 “通用 查询 代码 ”， 利 用 这 些 编号 
代码 可 以 方便 的 在 不 同 数据 库 中 进行 数据 移植 ， 
实现 数据 共享 。 

中 国 植物 名 称 数据 库 ， 应 该 是 人 人 都 可 以 自 
由 分 享 信息 的 新 一 代 植 物 名 称 数据 库 。 
3.3 控制 数据 来 源 
3.3.1 数据 来 源 为 了 保证 数据 的 正确 性 与 准 
确 性 ， 必 须 有 可 靠 的 数据 来 源 。《 中 国 植物 志 》 
及 其 英文 版 是 我 国 植物 科学 的 权威 资料 ， 是 四 代 
植物 学 家 的 心血 结晶 ， 经 过 了 历史 和 科学 的 验 
证 。 因 此 ， 中 国 植 物 名 称 数据 库 中 的 核心 数据 
(接受 发 表 学 名 ， 异 名 ， 名 称 详细 信息 ， 中 文通 
用 名 ， 分 类 等 级 ) 全 部 来 自 于 《中 国 植物 志 》 及 
其 英文 版 。 这 样 可 以 有 效 规避 因为 数据 来 源 不 明 





























































































































而 产生 错误 的 风险 。 
3.3.2 数据 规范 为 了 确保 中 国 植物 名 称 数据 


库 所 收录 数据 的 准确 性 与 严谨 性 。 特 别 制定 了 
《中 国 植物 物种 信息 名 称 数据 库 标 准 规范 》， 以 
国际 植物 命名 法 规 》 为 基本 原则 ， 以 《中 国 植 
物 志 》 及 其 英文 版 为 数据 依据 ， 结 合 参考 型 数据 
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库 建设 的 相关 规范 ， 对 收录 的 植物 名 称 进行 规范 
化 ， 标 准 化 管理 ， 杜 绝 张冠李戴 和 拼写 错误 ， 及 
时 更 新 过 时 数据 。 
3.3.3 数据 完善 植物 科学 的 发 展 日 新 月 异 ， 
中 国 植物 名 称 数据 库 也 应 该 是 动态 实时 更 新 的 ， 
及 时 修正 过 时 数据 ， 比 如 接受 发 表 学 名 因 种 种 原 
因 被 废弃 为 异 名 ,植物 分 类 群 地 位 变化 等 。 在 数 
据 完善 的 策略 上 ， 引 入 目前 流行 的 “open & free” 
模式 ， 通 过 用 户 的 参与 ， 采 用 “普通 用 户 提出 十 
管理 员 确 认 修 改 ” 和 “权威 专家 直接 修改 ”两 种 
方式 ， 结 合 传统 的 “管理 员 直 接 修改 ”方式 ， 实 
现 数据 库 的 实时 动态 更 新 。 
3.4 结构 化 数据 

将 植物 的 标准 名 称 数 据 各 个 组 成 部 分 解析 后 
分 别 作为 独立 字段 储存 ， 同 时 又 可 以 组 合成 完整 
的 植物 名 称 。 这 样 ， 看 似 不 规则 的 植物 名 称 ， 变 
成 了 一 段 由 中 文通 用 名 、 分 类 等 级 ( 科 )、 属 名 、 
种 加 词 、 种 命名 作者 、 种 下 等 级 类 型 、 种 下 等 级 
加 词 、 种 下 等 级 命名 作者 、 异 名 标记 、 文 献 来 源 
构成 的 一 串 代码 ， 它们 相互 独立 又 可 以 组 合成 
串 ， 这 样 大 大 提高 了 检索 效率 。 
3.5 查询 服务 建设 

判断 一 个 数据 库 系统 好 坏 的 另 一 个 标准 就 是 
看 用 户 能 否 利 用 该 系统 容易 快捷 的 检索 到 需要 的 
信息 ， 所 以 部 署 一 个 好 的 数据 检索 方式 是 保证 中 
国 植物 名 称 数据 库 建设 成 功 的 重要 前 提 条 件 。 

在 已 建成 的 国内 外 数据 库 中 ， 几 乎 都 是 采用 
传统 的 检索 功能 ， 智 能 化 技术 应 用 的 相当 少 ， 中 
国 植物 名 称 数 据 库 定 位 是 新 一 代 的 植物 数据 库 ， 
所 以 在 开发 过 程 中 应 用 了 一 些 已 有 的 技术 和 搜索 
策略 ， 使 之 尽量 实现 智能 化 ， 最 终 是 呈现 给 用 户 
一 个 “会 思考 ”的 智能 中 国 植物 名 称 数据 库 。 
3.5.1 检索 策略 判断 一 个 数据 库 系统 好 坏 的 
男 一 个 标准 就 是 看 用 户 能 否 利用 该 系统 容易 快捷 
的 检索 到 需要 的 信息 。 所 以 部 署 一 个 好 的 数据 检 
索 方式 是 保证 中 国 植物 名 称 数据 库 建设 成 功 的 重 
要 前 提 条 件 。 

在 结合 对 用 户 进 行 访问 调查 结果 和 以 往 其 他 
成 功 的 数据 库 产品 的 经 验 基础 上 ， 在 中 国 植物 名 
称 数据 库 的 检索 方式 部 署 上 ， 采 取 了 如 下 策略 。 

对 于 结构 化 的 植物 名 称 数据 ， 既 可 以 单独 查询 
某 个 部 分 ， 也 可 以 组 合 查询 部 分 记录 或 整 条 完整 记 
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录 。 这 部 分 采用 传统 的 关键 词 搜索 ， 直 接 匹 配 。 

对 于 植物 的 中 文 非 官方 名 ， 如 俗名 、 地 方 
名 、 行 业 名 等 ， 即 所 谓 “ 中 文 异 名 ”。 这 些 名 称 
多 而 复杂 ， 异 物 同名 和 同名 异物 现象 非常 普遍 。 
这 些 数据 通常 不 规则 。 但 经 过 研究 发 现 ， 这 些 
“中 文 异 名 ”的 使 用 频率 差异 很 大 ， 有 的 使 用 率 
很 高 很 普遍 ， 甚 至 比 植物 志 上 记录 的 中 文官 方 名 
还 广为人知 ， 而 有 的 虽然 存在 这 个 名 称 ， 但 使 用 
很 少 ， 几 近 废 弃 。 所 以 通过 各 种 渠道 对 名 称 进行 
打分 ， 如 通过 资料 文献 依据 、 查 询 频 率 、 与 用 户 
互动 等 方式 ， 按 照 打 分 高 低 排列 ， 可 以 有 效 减 少 
查 出 无 关 结 果 的 概率 。 
3.5.2 用 户 行为 分 析 技 术 和 智能 代理 技术 通 
过 记录 用 户 的 查询 检索 记录 ， 对 用 户 行 为 进行 分 
析 ， 将 分 析 结 果 以 访问 IP 为 索引 存档 ， 可 以 了 解 
用 户 的 兴趣 和 检索 习惯 ， 当 用 户 下 次 登录 到 系统 
时 ， 利 用 智能 代理 技术 ,依据 存档 的 用 户 行为 分 
析 结 果 ， 可 以 帮助 用 户 快 速 方便 地 查询 到 自己 需 
要 的 记录 〈 夏 勇 ，2009; 郑 玲 和 陈 都 ，2007) 。 
3.6 科研 工具 开发 

利用 数据 资源 开发 科研 工具 可 以 为 科学 研究 
提供 极 大 的 便利 。 例 如 基于 生物 多 样 性 数据 和 地 
理 信 息 系统 开发 的 BiodiversityMapping， 可 以 用 于 
地 区 生物 多 样 性 评价 〈 赵 海军 和 纪 力 强 ，2004) 。 
考察 国内 外 已 经 完成 的 植物 名 称 数 据 库 ， 几 乎 都 
是 “电子 植物 名 录 ”, “植物 学 名 电子 词典 ”， 或 者 
“电子 版 植物 志 索 引 ”， 没 有 进一步 的 开发 利用 。 
中 国 植物 名 称 数 据 库 作为 参考 型 数据 库 ， 除 了 要 
实现 传统 的 查询 功能 外 ， 还 要 利用 其 本 身 的 数据 ， 
开发 一 些 工具 ， 可 以 替代 科研 人 员 做 一 些 简单 的 
分 析 处 理工 作 ， 提 高 科研 的 工作 效率 。 
3.6.1 文献 知识 索引 系统 通过 事先 对 植物 名 
称 的 解析 和 预 处 理 ， 生 成 “查询 代码 ”， 包含 了 
植物 名 称 信息 的 主要 部 分 ， 以 此 作为 关键 词 ， 链 
接 各 大 知识 文献 搜索 引擎 ， 进 行文 献 查询 。 通 过 
中 国 植物 物种 信息 数据 库 的 “内 部 编码 ID” 链 
接 到 中 国 植物 物种 信息 数据 库 的 各 个 字库 。 通 过 
“查询 代码 ”或 “国家 标准 代码 ”( 国 家 质量 监督 
检验 检疫 总 局 ，1993) 链接 到 其 他 植物 数据 库 。 
上 述 结果 返回 后 ， 可 以 给 用 户 提 供 相当 丰富 的 关 
于 用 户 所 查询 相关 植物 的 各 类 知识 和 文献 资料 。 
同时 ， 尽 量 争 取 与 国际 大 型 植物 数据 库 的 合作 共 









































































































































享 ， 形 成 一 个 强大 的 植物 知识 网 络 系统 。 

3.6.2 命名 追溯 系统 中 国 植物 名 称 数据 库 收 
录 了 大 量 的 文献 引证 数据 ， 这 些 文献 引证 数据 记 
录 了 植物 名 称 的 发 表 和 引用 记录 ， 包 括 了 文献 的 
名 称 缩写 、 页 码 、 年 代 和 其 他 说 明 。 通 过 对 文献 
引证 数据 进行 分 析 ， 可 以 掌握 一 个 植物 名 称 的 来 
龙 去 脉 。 中 国 植物 名 称 数据 库 将 分 析 文 献 引 证 的 
过 程 通过 开发 命名 追溯 系统 的 小 工具 ， 将 极 大 地 
减轻 植物 命名 追溯 的 工作 量 。 














4 讨论 

中 国 植物 名 称 数据 库 是 中 国 科学 院 科 学 数据 
库 中 国 植物 物种 信息 数据 库 的 一 部 分 ， 也 是 整个 
物种 信息 数据 库 的 物种 名 录 和 查询 索引 ， 所 以 在 
建设 过 程 中 就 一 定 要 突出 其 “物种 名 录 ” 和 “ 索 
引 ” 的 功能 。 所 以 在 建设 过 程 中 ， 就 要 特别 注意 
收录 名 称 的 正确 性 和 权威 性 ， 建 立 严 格 且 有 操作 
性 的 名 称 标 准 规范 。 在 建设 中 采用 的 “名 录 独 
立 ， 索 引 分 开 ， 编 码 联系 ”策略 ， 就 是 一 种 既 保 
证 植物 名 录 规 范 准确 又 体现 索引 功能 的 有 效 手 
段 。 由 于 数据 来 源 本 身 可 能 存在 多 版 本 、 重 复 记 
录 、 失 误 甚 至 错误 ， 如 果 简 单 照 搬 中 国 植物 志 的 
名 录 索 引 作 为 《中 国 植 物 名 录 》， 必 然 存 在 很 大 
问题 ， 所 以 建立 独立 的 《中 国 植物 名 录 》， 以 《中 
国 植物 志 》 名 录 为 基础 ， 通 过 多 来 源 ， 多 渠道 的 
方法 ， 反 复 订 正 ， 有 效 排除 错误 。 同 时 ， 增 加 对 
应 的 内 部 及 通用 编码 代号 ， 同 名 称 数据 库 与 物种 
信息 库 其 他 部 分 以 及 其 他 数据 库 连 接 起 来 。 

中 国 植物 名 称 数据 库 的 定位 是 参考 型 数据 
库 ， 要 求 具有 相当 的 规范 性 和 权威 性 。 采 用 《中 
国 植物 志 》 和 《Flora of China》 作 为 基础 数据 
来 源 可 以 保证 基础 数据 的 规范 性 和 权威 性 。 然 而 
在 实际 操作 中 ， 由 于 志 书 记录 不 完整 的 少量 信 
息 ， 需 要 后 期 进行 补充 ， 这 部 分 数据 的 权威 性 就 
难以 得 到 保证 ， 所 以 只 能 作为 参考 数据 看 待 。 

植物 的 学 名 ， 包 括 接受 发 表 学 名 和 异 名 ， 是 
一 种 结构 化 的 数据 ， 而 且 不 重复 ， 可 看 作 一 串 规 
则 编码 ， 认 定 容 易 。 但 植物 的 中 文 名 ， 则 是 相当 
复杂 ， 数 量 多 而 且 重 复 率 高 ， 因 此 在 中 国 植物 名 
称 数据 库 中 ， 认 定植 物 的 中 文官 方 名 就 显得 十 分 
不 易 。 原 则 上 以 《中 国 植 物 志 》 记 录 为 准 ， 同 时 
参考 实际 使 用 情况 ， 可 以 保证 大 部 分 的 中 文官 方 
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名 认定 是 合理 可 靠 的 。 

在 数据 检索 方面 ， 要 达到 真正 意义 上 的 智能 搜 
索 ， 在 技术 上 现在 还 难以 实现 ， 所 以 我 们 需要 通过 
其 他 技术 手段 使 搜索 尽 可 能 的 “智能 化 "， 比 如 用 
户 行为 分 析 技 术 和 智能 代理 技术 。 然 而 ， 记 录用 户 
的 行为 可 能 会 构成 隐私 纠纷 ， 还 可 能 被 杀毒 软件 误 
判 为 木马 。 解决 的 方式 可 以 采用 在 页 面 告知 用 户 ， 
用 户 可 以 自行 选择 是 否 需要 相关 服务 ， 并 与 网 络 安 
全 公司 合作 ， 得 到 其 安全 软件 认证 ， 条 件 允 许 的 话 
还 可 以 向 国家 权威 部 门 申请 安全 认证 。 

中 国 植物 名 称 数据 库 作 为 中 国 植物 物种 信息 
数据 库 的 起 步 ， 其 成 功 建设 可 以 为 中 国 植物 物种 
信息 数据 库 其 他 子 库 的 建设 提供 一 个 模式 ， 同 时 
为 其 他 子 库 的 建设 奠定 了 名 录 和 索引 基础 。 随 着 
计算 机 技术 的 发 展 ， 越 来 越 多 的 新 技术 新 方法 将 
逐渐 引入 ， 数 据 库 将 越 来 越 丰 富 化 、 智 能 化 。 以 
极其 丰富 的 数据 资源 为 基础 ， 利 用 先进 的 计算 机 
技术 ， 比 如 云 计算 技术 等 “未 来 技术 ”， 还 可 以 
建立 一 套 有 效 的 植物 科学 研究 专家 系统 ， 为 推动 
植物 科学 的 进步 革新 提供 部 分 动力 。 
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